Large language models (LLMs) that have been trained on multilingual but not parallel text exhibit a remarkable ability to translate between languages. We probe this ability in an in-depth study of the pathways language model (PaLM), which has demonstrated the strongest machine translation (MT) performance among similarly-trained LLMs to date. We investigate various strategies for choosing translation examples for few-shot prompting, concluding that example quality is the most important factor. Using optimized prompts, we revisit previous assessments of PaLM's MT capabilities with more recent test sets, modern MT metrics, and human evaluation, and find that its performance, while impressive, still lags that of state-of-the-art supervised systems. We conclude by providing an analysis of PaLM's MT output which reveals some interesting properties and prospects for future work.
translated by 谷歌翻译
在本文中,我们介绍了DOCMT5,这是一种预先培训的多语言序列到序列语言模型,具有大规模并行文档。虽然以前的方法专注于利用句子级并行数据,但我们尝试构建一个可以理解和生成长文件的通用预训练模型。我们提出了一个简单有效的预训练目标 - 文件重新排序机翻译(DRMT),其中需要翻译和屏蔽的输入文件。 DRMT在各种文档级生成任务中对强大基线带来一致的改进,包括超过12个BLEU积分,用于观看语言对文件级MT,超过7个BLEU积分,用于看不见的语言对文件级MT和3胭脂-1位为言语对交叉术概要。我们在WMT20 De-en和IWSLT15 Zh-ZH文档翻译任务中实现了最先进的(SOTA)。我们还对文档预培训的各种因素进行了广泛的分析,包括(1)预培训数据质量的影响和(2)组合单语言和交叉训练的影响。我们计划公开使用我们的模型检查站。
translated by 谷歌翻译
在这项工作中,提出了基于实时手势识别系统的实时手势识别系统界面(HCI)。该系统由六个阶段组成:(1)手势分割,(3)使用转移学习方法使用六个预训练的CNN模型,(4)构建交互式的人机界面,(( 5)开发手势控制的虚拟鼠标,(6)使用卡尔曼过滤器来估计手部位置,因为指针的平滑度得到了改善。六个预训练的卷积神经网络(CNN)模型(VGG16,VGG19,RESNET50,RESNET101,INCEPTION-V1和MOBILENET-V1)已用于对手势图像进行分类。三个多级数据集(两个公开和一个自定义)已用于评估模型性能。考虑到模型的性能,已经观察到,与其他五个预训练的模型相比,Inception-V1在准确性,精度,召回和F-SCORE值方面表现出了更好的分类性能。手势识别系统已扩展并用于控制多媒体应用程序(例如VLC播放器,音频播放器,文件管理,播放2D Super-Mario-Bros游戏等),并在实时场景中具有不同的自定义手势命令。该系统的平均速度已达到35 fps(每秒帧),满足实时场景的要求。
translated by 谷歌翻译